Yiksan0315's Blog

Hypergeometric Distribution

  • or
  • 초기하분포

# Tag:


Hypergeometric Distribution

Binomial Distribution과 비슷하지만, 복원(replacement)을 하지 않는 표본추출이다.

즉, 어떤 것을 뽑고 난 후 다시 넣지 않고 줄어든 상태에서 다시 표본을 뽑는다.

따라서 Binomial Distribution과는 달리 매 번의 뽑는 시도가 dependent하다.

  • : 총 모집단의 크기, parameter
  • : 모집단에서 뽑고자 하는 목표 대상의 개수, parameter
  • : 총 시도 횟수, parameter
  • : 실제 성공 횟수, Random Variable.

하지만 모집단의 크기()이 매우 커진다면, 는 큰 차이를 가지지 못한다.
즉, 모집단의 크기가 커질수록 Binomial Theorem에 근사한다고 할 수 있다.

PMF

  • : 번의 성공을 하는 경우. 목표 대상이 개이므로 이 안에서 뽑는 경우의 수.
  • : 번의 실패를 하는 경우
  • : 전체 모집단에서 번의 시도를 통해 뽑는 전체 경우의 수.

check for Probability Axioms

  1. 모든 확률은 음수가 되지 않는다.
  2. Vandermonde's Identity에 의해 성립한다.

Variance

이항 분포와 비슷하게 지시 확률 변수의 합으로 나타낼 수 있다.

비복원 추출이므로, 지시 확률 변수의 합으로 나타내어도 서로 독립이 아니다. 따라서 초기하 확률 변수의 분산은 공분산을 포함한다.

  • : 어떤 물체이든, 번째에 뽑힐 확률 자체는 동일한 대칭성을 가진다. 따라서 각 분산은 동일하다. 그 식은
  • : 마찬가지로 어떤 두 개의 물체든 대칭이므로 동일한 공분산을 가진다. 이러한 것이 조합의 개수만큼 있으므로 곱해준다.
  • : 각각 물체가 뽑힐 확률(지시확률변수의 기대값=확률)이므로 이를 곱해주면 된다. 그 확률은 이다.
  • : 두 지시확률변수의 곱은, 두 사건의 교집합의 지시확률변수와 같다. 즉, 첫 번째 물체가 뽑히고(비복원) 두 번째 물체가 뽑히는 사건의 지시확률변수의 기대값이다.
  • 를 유한 모집단 수정 항(finite population correction factor)이라고 하며, 비복원 추출로 인한 분산의 감소를 반영시키는 역할을 한다.
    • 이라면, 베르누이 분포의 분산과 같아진다. 뽑는 것이 1개라면 비복원 추출의 의미가 없어지므로 동일하다.
    • 이 극단적으로 에 비해 매우 커지면 이항 분포의 분산 와 비슷해진다. 표본이 모집단보다 훨씬 작다면, 같은 걸 다시 고를 확률이 매우 작아지므로 비복원 추출의 의미가 퇴색된다.

Expectation

기대값의 선형성은 독립과 무관하게 적용되므로, 지시 확률 변수의 각각의 기대값을 모두 더해도 동일하다.

위에서처럼, 각각의 지시확률변수의 기대값은 곧 그 확률이므로 바로 구할 수 있다.

toc test

이 페이지는 리디주식회사에서 제공한 리디바탕 글꼴이 사용되어 있습니다. 리디바탕의 저작권은 리디주식회사가 소유하고 있습니다.

This Font Software is licensed under the SIL Open Font License, Version 1.1.

Copyright 2025. yiksan0315 All rights reserved.